Model Selection

GPTQ quantization

# GPTQ quantization

Qwen3 Embedding 4B W4A16 G128

This is the Qwen3-Embedding-4B model after GPTQ quantization, with significantly reduced video memory usage and minimal performance loss.

Qwen3 Embedding 8B W4A16 G128

GPTQ quantized version of Qwen3-Embedding-8B, significantly reducing VRAM requirements while maintaining high performance

Featured Recommended AI Models

AIbase

Empowering the Future, Your AI Solution Knowledge Base

English 简体中文繁體中文にほんご

© 2025AIbase